29 research outputs found

    Vers une exploitation efficace de grandes bases de connaissances par des graphes de contexte

    Get PDF
    National audienceUn problème lié à l'exploitation de graphe de connaissances, en particulier lors de traitements avec des méthodes d'apprentissage automatique, est le passage à l'échelle. Nous proposons ici une méthode pour réduire significativement la taille des graphes utilisés pour se focaliser sur une partie utile dans un contexte d'usage donné. Nous définissons ainsi la notion de graphe de contexte comme un extrait d'une ou plusieurs bases de connaissances généralistes (tels que DBpedia, Wikidata, Yago) qui contient l'ensemble d'informations pertinentes pour un domaine spécifique tout en préservant les propriétés du graphe d'origine. Nous validons l'approche sur un extrait de DBpedia pour des entités en lien avec le projet Data&Musée et le jeu de référence KORE selon deux aspects : la couverture du graphe de contexte et la préservation de la similarité entre ses entités

    Visualisations des thématiques d’un centre de recherche

    No full text
    National audienceLes mécanismes de financement et d’évaluation de la recherche ont conduit à une très forte croissance de la production d’articles scientifiques. Cette croissance a rendu difficile la recherche d’informations dans cette masse de données. Divers travaux dans le monde s’attachent à améliorer cette situation.Dans ce cadre, le département Traitement du Signal et des Images de Telecom ParisTech a entrepris un travail d’analyse sémantique des publications scientifiques de cet organisme au cours des cinq dernières années.Des méthodes assez classiques de traitement des langues naturelles combinées avec les travaux récents de description sémantique d’articles scientifiques permettent de proposer des regards nouveaux sur ces productions.Par exemple, il est possible des thématiques communes à des groupes chercheurs qui ne recoupent pas nécessairement la structure organisationnelle, essentiellement arborescente, des départements de recherche ou les rapprochements entre co-auteurs de publications.Il est également possible, par exemple, de visualiser l’évolution des thématiques pour des chercheurs ou des groupes de chercheur.Les visualisations proposées sont destinées à faciliter en interne les collaborations, notamment pour les nouveaux arrivants, et, à donner à l’extérieur une meilleure visibilité sur les résultats produits : recherche de spécialistes, coopération sur des projets…Le travail porte sur environ 4000 publications. Seulement 1200 environ sont directement disponibles sur la base de donnée interne à l’école. Pour les autres, divers problèmes, dont des problèmes de copyright, rendent l’accès plus complexe. La question de l’accessibilité des publications scientifiques sera abordée, mais pas traitée en profondeur.Nous verrons la chaine de traitement mise en œuvre, les données intermédiaires produites et les visualisations qui en sont issues. Nous montrerons comment la chaîne de production retenue se prête bien à l’ajout progressif des nouvelles publications et comment celle-ci pourrait être transposée à d’autres organismes ou d’autres activités.</p

    Aides informatiques à la réalisation de dessins animés

    Get PDF
    La circulation de l'information devient une préoccupation prioritaire des sociétés modernes. C'est pourquoi, la production audiovisuelle destinée aux télévisions et aux entreprises doit considérablement se développer dans les prochaines années. Une concurrence sévère nait dès maintenant de cette situation. Elle oppose les entreprises artisanales, qui jusqu'à ce jour occupaient le marché, et les sociétés industrielles qui se créent pour répondre à la demande prévisible. La vie et le savoir-faire d'un secteur d'activité sont menacé. Les petites entreprises, qui constituent le potentiel de production de dessin animé de notre pays, doivent s'adapter à une nouvelle situation internationale. En effet, la Grande-Bretagne, le Japon et les USA ont pris une place importante dans le domaine de la série télévisée de dessins animés. Ils ont conquis le marché en proposant leurs séries à la fois plus vite et moins cher. Contrairement à une idée répandue, ils n *utilisent pas encore systématiquement les techniques informatiques. Ils ont porté 1 *économie sur les frais de personnels et la simplicité de réalisation en mettant en oeuvre des mét~odes classiques d'industrialisation d'une fabrication: parcellisation du travail, normes de qualité souvent respectées à leur niveau minimum ... Mais la force commerciale et l'expérience acquises leur permettent désormais de proposer des productions de qualité croissante et d'intégrer progressivement des techniques modernes. dessin animé. Cette base de travail a été établie en collaboration étroite avec des professionnels du domaine. Nous l'avons complétée par une esquisse des apports actuels ou potentiels de l'informatique. Nous terminons en abordant les problèmes techniques que cé travail contribue à résoudre. Les principales références qui ont servi a établir ce chapitre sont: [BRI84], [MAR70], [BCT84]. Cette description ne concerne que le dessin animé classique le cartoon. Nous n'avons pas explicité ici les mille et une façons de faire du cinéma d'animation. Citons pour mémoire l'animation de papier découpé, de marionnettes, la pixilation. Face à la demande fortement croissante de dessins animés, destinés en particulier aux programmes de télévision, il devient nécessaire d'améliorer la productivité dans ce domaine. Outre des méthodes industrielles classiques, comme la parcellisation des tâches, des apports de nature différente peuvent être espérés de l'informatique: gestion de l'information (flux, mises à jours, cohérences entre documents), automatisation de tâches répétitives, outils interactifs de définition numérique d'images et de mouvements. Des recherches tendent à faire de l'ordinateur un outil nouveau de créa ti on d *images. animées. Not a mme nt, des études s*ont faites pour définir des objets avec des caractéristiques: élasticité, poids, ... et les manipuler en temps réel sur un écran d'ordinateur (formes du langage Logo, [LUC84]). D'autres études ont plutôt porté sur l'imitation du processus traditionnel de production de dessin animé. Des travaux ont été entrepris dans ce sens depuis plus de dix ans. Les plus grands studios: Hanna-Barbera, Walt Disn~y ont investi dans ces recherches. Aujourd'hui les systèmes informatiques d'aide à la production de dessins animés commencent seulement à sortir des laboratoires pour être utilisés en production [WAL81] [DIS84]. La fabrication des dessins animés est une activité créatrice nécessitant un grand travail manuel. Les trois points clés qui déterminent la concurrence entre les studios sont le coût, les délais et les volumes de production. Il sera intéressant de gagner sur chacun de ces points.No abstrac

    Constitution d’un corpus d’articles scientifiques avec représentation sémantique

    No full text
    National audience<p>Dans le cadre du projet SemBib, nous avons entrepris une représentationsémantique de la production scientifique de Télécom Paristech. Au delà desobjectifs internes, ce corpus enrichi est une source d’expérimentation et une ressourcepédagogique. ce travail repose sur l’utilisation de méthodes de fouillesde texte pour construire des graphes de connaissances, puis sur la productiond’analyses à partir de ces graphes. La proposition principale exposée est la méthodologiede production de graphes disjoints, aux rôles bien identifiés, afin depermettre des utilisations différenciées, et en particulier la comparaison entreméthodes de production et d’exploitation des graphes. Cet article est avant toutune proposition méthodologique pour l’organisation de représentation sémantiquede publications, en s’appuyant sur des méthodes de fouille de texte. Laméthode proposée facilite des approches d’enrichissement progressifs des représentationsavec possibilités d’évaluation à chaque étape</p

    SemBib, un dépôt local d’articles scientifiques sémantiquement décrits

    No full text
    National audience<p>Le projet SemBib est une initiative au sein de Telecom ParisTech pour constituer et exploiter unebase de connaissances sur nos publications scientifiques. Face à de grands entrepôts de référencesbibliographiques, nous considérons qu’une fédération de projets analogues à SemBib a du sens. Nousprésentons ici les avancées actuelles du projet SemBib et ses relations avec d’autres projets.</p

    Projet Data&Musée Représentations sémantiques et leur exploitation pour le traitement de données collectées dans des musées et monuments

    No full text
    International audienceData&Musée collecte de multiple données d'une centaines de partenaires, musées et monuments: billetterie, livres d'or, événements,... Nous avons fait le choix d'une représentation RDF de ces données pour faciliter les liens avec divers jeux de données: DBpedia, Wikidata, Joconde, DataTourisme ... Le but est d'entreprendre des explorations guidées par la sémantique des grands graphes que nous constituons. Nous présentons ici le contexte de Data&Musée et les principaux choix que nous faisons liés aux représentations sémantiques

    Ontologies pour l'éducation: retour d'expérience du projet ILOT

    No full text
    <p>Présentation des ontologies créées par Telecom ParisTech dans le cadre du projet ILOT, pour l'indexation de ressources pédagogiques</p
    corecore